1.
中国科学院地理科学与资源研究所,北京
100101;2.
中国地理学会,北京
100101;
3. 国家自然资源部基础地理信息中心,北京 100830
摘 要:2018年8月28日,中国地理学会在2018年中国地理学大会上发布了“全球变化科学研究数据出版、传播与科学影响力排行榜”。《青藏高原范围与界线地理信息系统数据》(作者:张镱锂、李炳元、郑度)以数据成果科学影响力积分67.844,3的总成绩荣获中国地理学会2018年数据成果科学影响力排行榜第一名。本文从数据内容、数据作者、数据研发资助基金项目、数据政策、数据出版、数据传播渠道、数据被引用、数据科学影响力积分等方面分析了该数据之所以能够位居“2018年中国地理学会数据成果科学影响力排行榜”榜首的原因。追朔三位作者对青藏高原研究的学术底蕴,如果从1987年李炳元先生发表的《青藏高原的范围》一文算起,至2014年《青藏高原范围与界线地理信息系统数据》的出版,三位作者在青藏高原范围和界线划定地理信息系统数据方面的研究,在地貌学、自然地理学、高原生态学、地理信息系统、地理数据等多领域融合方向上经历了27年执着探索。随着地理大数据的发展,数据用户对数据空间分辨率的要求越来越高。《青藏高原范围与界线地理信息系统数据》从1∶100万比例尺分辨率向更高空间分辨率、甚至米级分辨率的更新需求也向数据作者提出了新的任务。从数据浏览、数据下载到数据引用的情况也可以看出数据应用者在数据使用后的标引还不很规范,“用而不引”、“引不规范”等现象亟待改进。《青藏高原范围与界线地理信息系统数据》案例表明,数据的再应用是继续挖掘数据价值和发挥科学数据价值最重要的途径,数据科学影响力积分有助于度量数据再应用的动态变化和促进数据价值的发挥,有利于推动科学数据知识产权保护、提升科学研究速度和节约国家公共科研经费。
关键词:青藏高原;科学数据;科学影响力;排行榜;2018
DOI: 10.3974/geodp.2018.03.02
2018年8月28日在2018年中国地理学大会期间,中国地理学会成立了地理大数据工作委员会[1]并发布了“全球变化科学研究数据出版、传播与科学影响力排行榜”[2]。数据成果《青藏高原范围与界线地理信息系统数据》(作者:张镱锂、李炳元、郑度)[3–4]以数据成果科学影响力积分67.844,3的总成绩荣获中国地理学会2018年数据成果科学影响力排行榜第一名[2](图1)。数据作者付晶莹(中国科学院地理科学与资源研究所副研究员)是《中国公里网格人口分布数据集》[5–6]的第一作者和《中国公里网格GDP分布数据集》[7–8]的第三作者,以科学影响力积分39.460,0的总成绩荣获中国地理学会2018年数据作者科学影响力排行榜第一名[2]。付晶莹作为数据作者的科学影响力解析在数据科学影响力新的计量方法[9]已有详细的解析,本文就数据成果科学影响力排行榜榜首的情况做一解析。
2018年中国地理学会数据成果科学影响力排行榜前8名列于表1,其中,2014年出版的《青藏高原范围与界线地理信息系统数据》位于榜首。
表1 全球变化科学研究数据成果科学影响力排行榜(前8名)[2]
第一作者 |
数据集名称 |
出版年 |
科学影响力积分 |
排名 |
张镱锂 |
青藏高原范围与界线地理信息系统数据 |
2014 |
67.844,3 |
1 |
付晶莹 |
中国公里网格人口分布数据集 |
2014 |
63.132,1 |
2 |
黄耀欢 |
中国公里网格GDP分布数据集 |
2014 |
31.575,8 |
3 |
仲 波 |
中国-东盟1 km分辨率5 d频率地表反射率数据集(2013) |
2015 |
6.657,0 |
4 |
徐新良 |
中国农田熟制资源地理分布数据 |
2014 |
6.514,5 |
5 |
徐新良 |
中国5年间隔陆地生态系统空间分布数据集(1990-2010) |
2015 |
5.400,0 |
6 |
陈 军 |
全球30 m分辨率人造地表覆盖数据集(2010) |
2014 |
3.122,0 |
7 |
王 靓 |
青藏高原草地退化类型空间分布数据集 |
2014 |
2.822,4 |
8 |
图1 中国地理学会地理大数据工作委员会廖小罕主任为《青藏高原范围与界线地理信息系统数据》
第一作者张镱锂颁发“中国地理学会2018年数据成果科学影响力排行榜第一名”证书
2.1 青藏高原范围与界线地理信息系统数据
《青藏高原范围与界线地理信息系统数据》于2014年6月在“全球变化科学研究数据出版系统”出版[3],关联的数据论文发表在《地理学报》2014年(增刊)[4]。该数据集对青藏高原范围与界线位置给出了精确的定位和定量结论。根据这个数据集得出如下结论:青藏高原南起喜马拉雅山脉南缘,与印度、尼泊尔、不丹毗邻;北至昆仑山、阿尔金山和祁连山北缘,以4,000 m左右的高差与亚洲中部干旱荒漠区的塔里木盆地及河西走廊相连;西部为帕米尔高原和喀喇昆仑山脉,与吉尔吉斯斯坦、塔吉克斯坦、阿富汗、巴基斯坦和克什米尔地区接壤;东部以玉龙雪山、大雪山、夹金山、邛崃山及岷山的南麓或东麓为界;青藏高原的东部及东北部与秦岭山脉西段和黄土高原相衔接。地理范围包括25°59′37″N-39°49′33″N,73°29′56″E-104°40′20″E,边界总长度为11,745.96 km,面积为2,542.23×103 km2(图2)[4]。该数据集是在1∶100万比例尺精度基础上2014年更新,以.kmz 和.shp 两种格式出版,数据集由15个数据文件组成,数据量为390 KB(压缩为2个文件,289 KB)[3]。
2.2 《青藏高原范围与界线地理信息系统数据》数据作者
图2 青藏高原地理位置图[3](.kmz 格式) |
《青藏高原范围与界线地理信息系统数据》[3]由张镱锂研究员、李炳元研究员和郑度院士三名作者共同署名。
张镱锂,中国科学院地理科学与资源研究所研究员、土地科学与生物地理研究室主任,中科院青藏高原地球科学卓越创新中心研究员,中国科学院大学教授,尼泊尔地理学会终身荣誉会员,第六届全国优秀科技工作者。张镱锂研究员是中国青藏高原研究和自然地理学研究学术带头人之一,他任中国地理学会理事、副秘书长,自然地理专业委员会主任;中国青藏高原研究会常务理事、副秘书长,科考与科普工作委员会主任;他长期致力于青藏高原土地和植物生态学研究,在青藏高原土地利用与土地覆被变化及其生态效应、全球变化高原区域适应以及山地垂直地带性变化等方面的研究成果被同行学者认可并引用[10–14]。
李炳元,中国科学院地理科学与资源研究所研究员,主要从事青藏高原等地貌与第四纪环境研究。曾多次到青藏高原进行科学考察,获得第一手数据和资料,在青藏高原古地理环境演变[15]、青藏高原的范围[3]、横断山脉的范围[16]、中国地貌区划[17]等方面取得创新性成果。1987年,在《地理研究》上发表《青藏高原的范围》一文,根据青藏高原巨型构造地貌特征,提出将海拔高度4,000 m以上连片分布的高原面地区归属于青藏高原,而边缘地区,如横断山脉的高原面,虽然零星分布,但仍能恢复出原高原分布范围的,也应归入青藏高原[18]。考虑到山体的完整性,高原范围宜根据4,000 m山顶面分布的高山范围确定。高原的边界以高山的山麓线与高原外围的中低山和丘陵平原分界。
郑度,中国科学院院士,中国科学院地理科学与资源研究所研究员、学位委员会主任,中国科学院大学教授,中国青藏高原研究会名誉理事长,中国大百科全书地理卷主任。他提出了适用于山地与高原的自然区划原则和方法[19];在青藏高原自然环境的地域分异与格局研究中阐明了高原山地垂直自然带类型系统并构建其分布模式[20–21];揭示了高原独特的生态现象及其空间格局、高原植物区系地理的地域分异[22–23];阐明了高海拔区域三维地带性规律,提出了青藏高原自然地域系统方案[24]。他作为主要研究者的“青藏高原隆起及其对自然环境和人类活动影响的综合研究”项目于1987年获国家自然科学奖一等奖[25]。
如果从1987年李炳元先生发表的《青藏高原的范围》[18]一文算起,至2014年《青藏高原范围与界线地理信息系统数据》的出版,三位作者在青藏高原范围和界线划定地理信息系统数据方面的研究,在地貌学、自然地理学、高原生态学、地理信息系统、地理数据等多领域融合方向上经历了27年执着探索。
2.3 《青藏高原范围与界线地理信息系统数据》资助项目
《青藏高原范围与界线地理信息系统数据》是在以下四项基金资助下完成:国家科学技术部重点基础研究发展规划项目(G1998040800);中国科学院知识创新工程领域前沿项目(CXIOGE01-01, CXIOG-A00-03-02);中国科学院战略性先导科技专项 (XDB03030500)。当然,这四项基金资助产生的不仅仅《青藏高原范围与界线地理信息系统数据》一项成果。
3.1 数据出版
数据出版包括元数据、实体数据和数据论文关联一体出版。全部数据均需要在“全球变化科学研究数据出版系统”网上中英文双语投稿。 经过同行专家评审后,元数据与DOI系统关联,实体数据在“全球变化科学研究数据出版系统”出版[3];第一期数据论文在《地理学报》2014年增刊上发表[4]。
3.2 数据共享政策
该数据于2014年6月在“全球变化科学研究数据出版系统”出版后,数据共享政策为: (1)“数据”以最便利的方式通过全球变化科学研究数据出版系统网站免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与数据出版部门签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[26]。
3.3 数据传播渠道
《青藏高原范围与界线地理信息系统数据》传播渠道包括元数据传播、实体数据传播和数据论文传播。
元数据传播:《青藏高原范围与界线地理信息系统数据》出版后,元数据通过以下三个渠道传播:DOI注册系统、DCI(Data Citation Index)/Web of Science (科睿唯安科学网中的数据引文检索系统)、GEOSS Portal (国际综合地球观测系统数据共享网)数据引文检索系统和中国GEOSS(中国综合地球观测系统数据共享网)。
实体数据传播:实体数据全部通过“全球变化科学研究数据出版系统”在线完成。
数据论文传播:通过“全球变化科学研究数据出版系统”官方网站、《地理学报》官方网站和CNKI检索系统。
此外,中国地理学会与中国科学院地理科学与资源研究所在中国科学院科学传播局的支持下,开展了“全球变化科学研究数据出版与共享”百校传播活动,在国内外数十次科学研讨会上传播这些数据成果。
通过上述数据传播渠道和传播活动,《青藏高原范围与界线地理信息系统数据》成为“全球变化科学研究数据出版系统”热点数据集之一,网络浏览量达到11,410次。
4.1 数据被引用统计
该数据成果发表4年来(2014年6月至2018年5月)总计被引用11次(表2), 包括2014年发表数据论文中自引1次、2015年被他引3次、2016年被他引1次、2017年被他引4次、2018年被他引2次。引用的论文发表在国内外学术期刊上,包括: Cryosphere、Journal of geographical sciences、Nature、Atmospheric chemistry and physics、Environmental earth sciences、Journal of glaciology、Ecosystem services、《地理学报》、《资源科学》和《地理研究》。其中,除了2014年为自引外,其他10次均为他引,他引率为91%。
表2 《青藏高原范围界线与面积地理信息系统数据》被引论文统计表
被引论文发表期刊名称 |
被引年 |
被引论文题目 |
期刊当年影响因子* |
备注 |
地理学报 |
2014 |
青藏高原范围界线与面积地理信息系统数据 |
2.300,0 |
自引 |
资源科学 |
2015 |
青藏高原自然保护区特征与保护成效简析[27] |
0.932,8 |
他引 |
Cryosphere |
2015 |
3.641,0 |
他引 |
|
Journal of Geographical Sciences |
2015 |
Recent changes in wetlands on
the Tibetan Plateau: A review[29] |
1.923,0 |
他引 |
Nature |
2016 |
High-resolution mapping of
global surface water and its long-term changes[30] |
40.137,0 |
他引 |
Atmospheric Chemistry and
Physics |
2017 |
Tracing changes in atmospheric
moisture supply to the drying Southwest China[31] |
5.509,0 |
他引 |
Environmental Earth Sciences |
2017 |
The dynamic response of lakes
in the Tuohepingco Basin of the Tibetan Plateau to climate change[32] |
1.435,0 |
他引 |
Journal of Glaciology |
2017 |
Glacier changes on the Tibetan
Plateau derived from Landsat imagery: mid-1970s-2000-13[33] |
3.200,0 |
他引 |
地理研究 |
2017 |
羌塘高原降水空间分布及其变化特征[34] |
1.572,1 |
他引 |
Ecosystem Services |
2018 |
4.395,0 |
他引 |
|
地理学报 |
2018 |
青藏高原维管植物物种丰富度分布的情景模拟[36] |
2.799,4 |
他引 |
* 中文期刊影响因子来自CSCD-JCR中国科技期刊引证指标。统计时,2017、2018年的影响因子没有发布,用2016年的因子替代计算。英文期刊影响因子来自https://www.scijournal.org/,统计时,2018年的影响因子用2017年的替代计算。
4.2 数据科学影响力积分
根据数据成果科学影响力积分统计和计算方法[9],《青藏高原范围与界线地理信息系统数据》历年国内与国际科学影响力积分、历年科学影响力总积分和4年累积科学影响力总积分列于表3。
从表2和表3可以看出,《青藏高原范围与界线地理信息系统数据》被应用领域比较广泛,被应用论文发表的期刊涉及地理、大气化学、大气物理、环境科学、冰川、冰冻圈、生态系统、自然资源等领域期刊和综合性的《自然》杂志。该数据集在国内外都产生很大的影响力,其中,国际影响力(包括发表在Nature的引用文章)累积影响力积分达到60.24,高于国内影响力总积分7.604,3。
表3 《青藏高原范围与界线地理信息系统数据》历年与累积科学影响力积分统计表
年度 |
历年国内影响力积分 |
历年国际影响力积分 |
历年科学影响力总积分 |
历年累计科学影响力总积分 |
2014 |
2.300,0 |
0.000,0 |
2.300,0 |
2.300,0 |
2015 |
0.932,8 |
5.564,0 |
6.496,8 |
8.796,8 |
2016 |
0.000,0 |
40.137,0 |
40.137,0 |
48.933,8 |
2017 |
1.572,1 |
10.144,0 |
11.716,1 |
60.649,9 |
2018 |
2.799,4 |
4.395,0 |
7.194,4 |
67.844,3 |
总计 |
7.604,3 |
60.240,0 |
|
67.844,3 |
《青藏高原范围与界线地理信息系统数据》是研究青藏高原的基础数据,该数据集能够荣登2018年中国地理学会数据成果科学影响力排行榜榜首,说明基础数据是受广大科研工作者关注和使用最多的数据。从数据被引用的情况和该数据的三位作者的学术经历可以从另一个侧面理解这个数据,这是一个由三位致力于青藏高原研究的专家用27年的时间孜孜不倦地探索和研究,“深入浅出”地用最简洁的方式留给科学界的、数字化的、地理学术遗产。该数据的出版和共享情况表明,越是基础数据,越是简洁数据,越需要深厚的科学底蕴,越需要扎实、甚至经典的科学理论作为基础。诚然,随着地理大数据的发展,随着地球观测科学与技术的进展,数据用户对数据空间分辨率的要求越来越高。《青藏高原范围与界线地理信息系统数据》从1∶100万比例尺分辨率向更高空间分辨率、甚至米级分辨率的更新也摆到日程中来。
从数据浏览、数据下载到数据引用的情况也可以看出一些问题,特别是目前数据应用者在数据使用后的标引还不很规范,“用而不引”、“引不规范”等现象大有案例在。随着科学数据引用规范化的普及[37]、数据应用的长尾效应,该数据集的影响力将会更高。
《青藏高原范围与界线地理信息系统数据》案例表明,数据的再应用是继续挖掘数据价值和发挥科学数据价值最重要的途径,数据科学影响力积分有助于度量数据再应用的动态变化和促进数据价值的发挥,有利于推动科学数据知识产权保护、提升科学研究速度和节约国家公共科研经费。
[1] 中国地理学会. 中国地理学会大数据工作委员会成立[R]. 全球变化数据学报, 2018, 2(3): 354-356. DOI: 10.3974/geodp.2018.03.18.
[2] 中国地理学会. 全球变化科学研究数据出版与共享排行榜[R]. 全球变化数据学报, 2018, 2(3): 243-248. DOI: 10.3974/geodp.2018.03.01.
[3] 张镱锂, 李炳元, 郑度. 青藏高原范围界线与界线地理信息系统数据[DB/OL]. 全球变化科学研究数据出版系统, 2014. DOI: 10.3974/ geodb.2014.01.12.V1.
[4] 张镱锂, 李炳元, 郑度. 青藏高原范围界线与面积地理信息系统数据[J]. 地理学报, 2014, 69(增刊): 65-68. DOI: 10.11821/dlxb2014S012.
[5] 付晶莹, 江东, 黄耀欢. 中国公里网格人口分布数据集[DB/OL]. 全球变化科学研究数据出版系统, 2014. DOI: 10.3974/geodb.2014.01.06.V1.
[6] 付晶莹, 江东, 黄耀欢. 中国公里网格人口分布数据集[J]. 地理学报, 2014, 69(增刊): 41-44. DOI: 10.11821/dlxb2014S006.
[7] 黄耀欢, 江东, 付晶莹. 中国公里网格GDP分布数据集[DB/OL]. 全球变化科学研究数据出版系统, 2014. DOI: 10.3974/geodb.2014.01.07.V1.
[8] 黄耀欢, 江东, 付晶莹. 中国公里网格GDP分布数据集[J]. 地理学报, 2014, 69(增刊): 45-48. DOI: 10.11821/dlxb2014S007.
[9] 刘闯. 数据影响力积分(DIS)——数据影响力新的计量方法[J]. 全球变化数据学报, 2018, 2(2): 135-143. DOI: 10.3974/geodp.2018.02.02.
[10] 张镱锂, 祁威, 周才平等. 青藏高原高寒草地净初级生产力(NPP)时空分异[J]. 地理学报, 2013, 68(9): 1197-1211.
[11] 李士成, 张镱锂, 何凡能. 过去百年青海和西藏耕地空间格局重建及其时空变化[J]. 地理科学进展,2015, 32(2): 197-206.
[12] 张镱锂,李炳元,郑度. 论青藏高原范围与面积[J]. 地理研究, 2002, 21(1): 1-8.
[13] 张镱锂, 刘林山, 摆万奇等. 青藏公路对区域土地利用和景观格局的影响——以格尔木至唐古拉山段为例[J]. 地理学报, 2002, 57(3): 253-266.
[14] 李兰晖, 刘林山, 张镱锂等. 青藏高原高寒草地物候沿海拔梯度变化的差异分析[J]. 地理研究, 2017, 36(1): 26-36.
[15] 李炳元, 潘保田, 程维明等. 中国地貌区划新论[J]. 地理学报, 2013, 67(3): 291-306.
[16] 李炳元, 潘保田. 青藏高原古地理环境研究[J]. 地理研究, 2002, 21(1): 61-70.
[17] 李炳元. 横断山区地貌区划[J]. 山地研究, 1989, 7(1): 13-20.
[18] 李炳元. 青藏高原的范围[J]. 地理研究, 1987, 6(3): 57-64.
[19] 郑度. 横断山区自然地域分异和区划[J]. 山地研究, 1989, 7(1): 1-2.
[20] 郑度. 青藏高原对中国西部自然环境地域分异的效应[J]. 第四纪研究, 2001(6): 484-489.
[21] 郑度, 李炳元. 青藏高原自然地理研究的进展[J]. 地理学报, 1990, 45(2): 235-244.
[22] 郑度, 陈伟烈. 东喜马拉雅植被垂直带的初步研究[J]. 植物学报, 1981, 23(3): 228-235.
[23] 郑度, 张百平. 喀喇昆仑山——西昆仑山地区的垂直自然带、环境和自然保护问题[J]. 自然资源学报, 1989, 4(3): 254-266.
[24] 郑度, 李炳元. 青藏高原自然环境的演化与分异[J]. 地理研究, 1990, 9(2): 1-10.
[25] 国家自然科学奖励委员会办公室. 1987年国家自然科学奖获一等奖项目简介[J]. 中国科学基金, 1989(2): 70-82.
[26] 全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. DOI: 10.3974/dp.policy.2014.05 (2017年更新).
[27] 张镱锂, 吴雪, 祁威等. 青藏高原自然保护区特征与保护成效简析[J]. 资源科学, 2015, 37(7): 1007-7588.
[28] Wang, K., Zhang, T., Zhong, X. Changes in the timing and duration of the near-surface soil freeze/thaw status from 1956 to 2006 across China [J]. Cryosphere, 2015, 9(3): 1321-1331.
[29] Zhao, Z. L., Zhang, Y. L., Liu, L. S., et al. Recent changes in wetlands on the Tibetan Plateau: a review [J]. Journal of Geographical Sciences, 2015, 2(7): 879-896.
[30] Pekel, J. F., Cottam, A., Gorelick, N., et al. High-resolution mapping of global surface water and its long-term changes [J]. Nature, 2016, 540(7633): 418-422.
[31] Zhang, C., Tang, Q. H., Chen, D. L., et al. Tracing changes in atmospheric moisture supply to the drying Southwest China [J]. Atmospheric Chemistry and Physics, 2017, 17(17): 10383-10393.
[32] Zhao, Z. L., Liu, F. G., Zhang, Y. L. The dynamic response of lakes in the Tuohepingco Basin of the Tibetan Plateau to climate change [J]. Environmental Earth Sciences, 2017, 76(3): 1866-6280.
[33] Ye, Q. H., Zong, J. B., Tian, L. D., et al. Glacier changes on the Tibetan Plateau derived from Landsat imagery: mid-1970s-2000-13 [J]. Journal of Glaciology, 2017, 63(238): 1-15.
[34]
李兰晖, 刘琼欢, 张镱锂等. 羌塘高原降水空间分布及其变化特征[J]. 地理研究, 2017, 36(11): 2047-2060.
[35] Li, S. C., Zhang, Y. L., Wang, Z. F., et al. Mapping human influence intensity in the Tibetan Plateau for conservation of ecological service functions [J]. Ecosystem Services, 2018, 30(B): 276-286.
[36] 范泽孟, 黄言, 岳天祥. 青藏高原维管植物物种丰富度分布的情景模拟[J]. 地理学报, 2018, 73(1): 164-176.
[37]
刘闯, 马军花, Uhlir, P. F.等. 科学数据出版成果著录规范化研究[J]. 全球变化数据学报, 2018, 2(2): 123-134. DOI: 10.3974/geodp.2018.02.01.